DLSI en Tweet-Norm 2013: Normalización de Tweets en Español

نویسندگان

  • Alejandro Mosquera López
  • Paloma Moreda
چکیده

The lexical richness and its ease of access to large volumes of information converts the Web 2.0 into an important resource for Natural Language Processing. Nevertheless, the frequent presence of non-normative linguistic phenomena that can make any automatic processing challenging. In this paper is described the participation in the Text Normalisation Workshop at the SEPLN conference (Tweet-norm 2013). The Workshop includes one unique task focused on the normalisation of Spanish tweets. For this task we have used TENOR, a multilingual lexical normalisation tool for Web 2.0 texts.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Introducción a la Tarea Compartida Tweet-Norm 2013: Normalización Léxica de Tuits en Español

An overview of the shared task is presented: description, corpora, annotation, preprocess, participant systems and results.

متن کامل

Prototipado Rápido de un Sistema de Normalización de Tuits: Una Aproximación Léxica

This work describes the system for the normalization of tweets in Spanish designed by the Language in the Information Society (LYS) Group of the University of A Coruña for Tweet-Norm 2013. It is a conceptually simple and flexible system, which uses few resources and that faces the problem from a lexical point of view.

متن کامل

Contextualisation automatique de Tweets à partir de Wikipédia

RÉSUMÉ. Les réseaux sociaux sont au centre des communications sur internet et une grande partie des échanges communautaires se fait à travers eux. Parmi eux, l’apparition de Twitter a donné lieu à la création d’un nouveau type de partage d’informations où les messages sont limités à 140 caractères. Les utilisateurs de ce réseau s’expriment donc succinctement, souvent en temps réel à partir d’un...

متن کامل

A Sentiment Analysis Model of Spanish Tweets

What people say on social media has turned into a rich source of information to understand social behavior. Sentiment analysis of Twitter data has been widely used to capture trends in public opinion regarding important events such as political elections. However, current research in social media analysis in political domains faces two major problems, namely: sentiment analysis methods implemen...

متن کامل

Análisis empírico de la dispersión del español mexicano

Resumen. En este art́ıculo se presenta un sistema que pretende facilitar el análisis de la dispersión del español mexicano. Se presentan gráficas resultantes, aśı como los modelos del sistema. El objetivo es mostrar el avance del sistema y su posible aplicación en el cálculo de la dispersión del lenguaje para otros idiomas. Los experimentos fueron realizados sobre dos tipos de corpora: noticias ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013